
gen rav_canton = substr(rav_oste,1,2)
tab rav_canton,m

* Gen indicator if an ad explicitly addresses both (or more) gender
gen 	neutral_title		= regexm(stellenbezeichnung,"w/m")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"m/w")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"W/M")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"M/W")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"f/h")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"h/f")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"H/F")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"F/H")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"m/f")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"f/m")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"F/M")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"M/F")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"m&w")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"M&W")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"w/ m")							
replace neutral_title		= 1 if regexm(stellenbezeichnung,"/in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"/ in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,":in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\*in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\-in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\/In")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\|in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\.in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\.trice")
replace neutral_title		= 1 if regexm(stellenbezeichnung, "\-r")
replace neutral_title		= 1 if regexm(stellenbezeichnung, "In") & strpos(stellenbezeichnung, " In")==0 & regexm(stellenbezeichnung,"^In")!=1 & regexm(stellenbezeichnung,"-In")!=1
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\_in")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\_trice")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"\(trice\)")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"er/ère")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"er/-ère")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"er/ ère")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"e/r")
replace neutral_title		= 1 if regexm(stellenbezeichnung,"och")==1 & regexm(stellenbezeichnung,"öchin")==1 
replace neutral_title		= 1 if regexm(stellenbezeichnung,"frau")==1 & regexm(stellenbezeichnung,"mann")==1 
replace neutral_title		= 1 if regexm(stellenbezeichnung,"rauen")==1 & regexm(stellenbezeichnung,"änner")==1 
replace neutral_title		= 1 if 	strpos(stellenbezeichnung,"er ") & ///
							strpos(stellenbezeichnung,"in ")  & ///	
							strpos(stellenbezeichnung," in ")==0  & ///								
							regexm(stellenbezeichnung,"/")  & ///	
							neutral_title==0									
replace neutral_title		= 1 if 	strpos(stellenbezeichnung,"er ") & ///
							regexm(stellenbezeichnung,"in$")  & ///	
							regexm(stellenbezeichnung,"/") 	 & ///	
							neutral_title==0									
replace neutral_title		= 1 if strpos(stellenbezeichnung,"er/") & ///
							regexm(stellenbezeichnung,"in$")		 & ///	
							neutral_title==0														
replace neutral_title		= 1 if 	regexm(stellenbezeichnung,"er$") & ///
							strpos(stellenbezeichnung,"in ")  & ///	
							strpos(stellenbezeichnung," in ")==0  & ///								
							regexm(stellenbezeichnung,"/")		 & ///	
							neutral_title==0									
replace neutral_title		= 1 if 	regexm(stellenbezeichnung,"er$") & ///
							strpos(stellenbezeichnung,"in/")  	 & ///	
							neutral_title==0									
replace neutral_title		= 1 if regexm(stellenbezeichnung,"eur/euse")  & ///	
							neutral_title==0									
replace neutral_title		= 1 if regexm(stellenbezeichnung,"eur / euse")  & ///	
							neutral_title==0									
replace neutral_title		= 1 if regexm(stellenbezeichnung,"eur\(euse\)")	 & ///	
							neutral_title==0										
replace neutral_title		= 1 if 	strpos(stellenbezeichnung,"er ") & ///
							regexm(stellenbezeichnung,"in/") 	 & ///	
							neutral_title==0		
replace neutral_title		= 1  if 	strpos(stellenbezeichnung,"in ") & ///
							regexm(stellenbezeichnung,"er/") 	 & ///	
							regexm(stellenbezeichnung,"omputer/")!=1 &  /// without computer
							regexm(stellenbezeichnung,"ngineer/")!=1 &  /// without engineer						
							neutral_title==0								
replace neutral_title		= 1  if 	strpos(stellenbezeichnung,"innen ") & ///
							regexm(stellenbezeichnung,"en/")  & ///	
							neutral_title==0
							
replace neutral_title		= 1 if 	strpos(stellenbezeichnung,"en ") & ///
							regexm(stellenbezeichnung,"innen/")  & ///	
							neutral_title==0		
							
replace neutral_title		= 1 if 	strpos(stellenbezeichnung,"en ") & ///
							regexm(stellenbezeichnung,"innen /")  & ///	
							regexm(stellenbezeichnung,"äuerinnen /")!=1  & ///	
							neutral_title==0	
														
replace neutral_title		= 1 if 	regexm(stellenbezeichnung,"eur/") & ///
							regexm(stellenbezeichnung,"eurin")   & ///	
							neutral_title==0
							
replace neutral_title		= 1 if 	regexm(stellenbezeichnung,"eurin/") & ///
							regexm(stellenbezeichnung,"eur")  	 & ///	
							neutral_title==0						
							
replace neutral_title		= 1 if 	regexm(stellenbezeichnung,"eur$") & ///
							regexm(stellenbezeichnung,"eurin")  & ///
							regexm(stellenbezeichnung,"/") & ///	
							neutral_title==0
							
replace neutral_title		= 1 if 	strpos(stellenbezeichnung,"eur ") & ///
							regexm(stellenbezeichnung,"eurin")  & ///
							regexm(stellenbezeichnung,"/")		 & ///	
							neutral_title==0					

* Gen indicator if an ad explicitly addresses women
gen 	female_title 	= regexm(stellenbezeichnung,"\(f\)")
replace female_title 	= 1 if regexm(stellenbezeichnung,"\(w\)")
replace female_title 	= 1 if regexm(stellenbezeichnung,"\(F\)")
replace female_title 	= 1 if regexm(stellenbezeichnung,"\(W\)")
replace female_title 	= 1 if regexm(stellenbezeichnung,"eiblich") & ///
						regexm(stellenbezeichnung,"ännlich")!=1

gen 	female_title_expl = female_title 				// this variable contains only the very explicit mentionings of a preference for female workers

replace female_title	= 1 if regexm(stellenbezeichnung,"frau") & ///	
						regexm(stellenbezeichnung,"mann")!=1 & ///	
						regexm(stellenbezeichnung,"Mann")!=1 & ///								
						neutral_title==0 & ///
						female_title==0	
							
replace female_title	= 1 if regexm(stellenbezeichnung,"in$") & ///
						neutral_title==0 & ///
						regexm(stellenbezeichnung,"/")!=1 & ///
						regexm(stellenbezeichnung,"-")!=1 & ///
						rav_canton!="FR"  & ///
						rav_canton!="VD" & ///
						rav_canton!="GE"    & ///
						rav_canton!="NE" & ///
						rav_canton!="TI"    & ///
						female_title==0	
						
replace female_title	= 1 if strpos(stellenbezeichnung, "in ") 		& ///
						strpos(stellenbezeichnung, "ist ")==0		& ///
						strpos(stellenbezeichnung, " in ")==0  		& ///
						strpos(stellenbezeichnung, " (in ")==0  		& ///
						strpos(stellenbezeichnung, " ein ")==0  		& ///
						strpos(stellenbezeichnung, "schein ")==0  		& ///
						neutral_title==0 & ///
						regexm(stellenbezeichnung,"/")!=1 & ///
						regexm(stellenbezeichnung,"-")!=1 & ///
						regexm(stellenbezeichnung,"\|")!=1 & ///
						regexm(stellenbezeichnung,"oder")!=1 & ///
						rav_canton!="FR"  & ///
						rav_canton!="VD" & ///
						rav_canton!="GE"    & ///
						rav_canton!="NE" & ///
						rav_canton!="TI"  	& ///
						female_title==0							
												
replace female_title	= 1 if regexm(stellenbezeichnung,"trice") & ///
						neutral_title==0 & ///
						regexm(stellenbezeichnung,"/")!=1 & ///
						regexm(stellenbezeichnung,"-")!=1 & ///
						regexm(stellenbezeichnung,"\|")!=1 & ///
						regexm(stellenbezeichnung,"\(trices\)")!=1 & ///
						regexm(stellenbezeichnung,"\&")!=1 &  ///
						regexm(stellenbezeichnung,"eur")!=1 & ///
						female_title==0	
						
replace female_title	= 1 if regexm(stellenbezeichnung,"euse") & ///
						neutral_title==0 & ///
						regexm(stellenbezeichnung,"/")!=1 & ///
						regexm(stellenbezeichnung,"-")!=1 & ///
						regexm(stellenbezeichnung,"\|")!=1 & ///
						regexm(stellenbezeichnung,"\(trices\)")!=1 & ///
						regexm(stellenbezeichnung,"\&")!=1 &  ///
						regexm(stellenbezeichnung,"eur")!=1 & ///
						female_title==0							

replace female_title	= 1 if regexm(stellenbezeichnung,"ochter") & ///
						regexm(stellenbezeichnung,"ellner")!=1	& ///   without kellner
						female_title==0	 
						
replace female_title	= 1 if regexm(stellenbezeichnung,"öchter") & ///
						female_title==0	 
						
* Gen indicator if an ad explicitly addresses men						
gen 	male_title 		= regexm(stellenbezeichnung,"\(m\)")
replace male_title		= 1 if regexm(stellenbezeichnung,"\(h\)")
replace male_title		= 1 if regexm(stellenbezeichnung,"\(M\)")
replace male_title		= 1 if regexm(stellenbezeichnung,"\(H\)")						
replace male_title		= 1 if 	regexm(stellenbezeichnung,"\( m \)")
replace male_title		= 1  if regexm(stellenbezeichnung,"ännlich")  & ///
						regexm(stellenbezeichnung,"eiblich")!=1
replace male_title		= 1  if regexm(stellenbezeichnung,"änner\)") & ///
						regexm(stellenbezeichnung,"rauen")!=1
						
gen 	male_title_expl = male_title 								// this variable contains only the very explicit mentionings of a preference for male workers
										
replace male_title		= 1 if regexm(stellenbezeichnung, "er$") & ///
						neutral_title!=1 & ///
						female_title_expl!=1 &  ///
						regexm(stellenbezeichnung,"ellte")!=1 & ///
						regexm(stellenbezeichnung,"in")!=1 & ///
						regexm(stellenbezeichnung,"ochter$")!=1 &  /// without tochter (Servicetochter)						
						regexm(stellenbezeichnung,"ngineer$")!=1 &  /// without engineer
						regexm(stellenbezeichnung,"eader$")!=1 &  ///	without leader
						regexm(stellenbezeichnung,"anager$")!=1 &  /// without manager
						regexm(stellenbezeichnung,"eacher$")!=1 &  /// without teacher
						regexm(stellenbezeichnung,"uisinier$")!=1 &  /// without cuisinier
						regexm(stellenbezeichnung,"inder$")!=1 &  /// without kinder
						regexm(stellenbezeichnung,"eveloper$")!=1 &  /// without developer
						rav_canton!="FR"  & ///
						rav_canton!="VD" & ///
						rav_canton!="GE"    & ///
						rav_canton!="NE" & ///
						rav_canton!="TI"   & ///
						male_title!=1							
						
replace male_title		= 1 if regexm(stellenbezeichnung, "er$") & ///
						neutral_title!=1 & ///
						female_title_expl!=1 &  ///						
						regexm(stellenbezeichnung,"ellte")!=1 & ///
						strpos(stellenbezeichnung,"in ")==0 & ///
						regexm(stellenbezeichnung,"in$")!=1 & ///
						regexm(stellenbezeichnung,"ochter$")!=1 &  /// without tochter (Servicetochter)												
						regexm(stellenbezeichnung,"ngineer$")!=1 &  /// without engineer
						regexm(stellenbezeichnung,"eader$")!=1 &  ///	without leader
						regexm(stellenbezeichnung,"anager$")!=1 &  /// without manager
						regexm(stellenbezeichnung,"eacher$")!=1 &  /// without teacher
						regexm(stellenbezeichnung,"uisinier$")!=1 &  /// without cuisinier
						regexm(stellenbezeichnung,"inder$")!=1 &  /// without kinder
						regexm(stellenbezeichnung,"eveloper$")!=1 &  /// without developer
						rav_canton!="FR"  & ///
						rav_canton!="VD" & ///
						rav_canton!="GE"    & ///
						rav_canton!="NE" & ///
						rav_canton!="TI"  & ///
						male_title!=1							  	
						
replace male_title 	= 1 if strpos(stellenbezeichnung, "er ") & ///
						neutral_title!=1 & ///
						female_title_expl!=1 & ///						
						regexm(stellenbezeichnung,"ellte")!=1 & 	///
						regexm(stellenbezeichnung,"in")!=1 & 		///
						strpos(stellenbezeichnung, " oder ")==0 & 	/// without "oder"	
						strpos(stellenbezeichnung, " per ")==0 & 	/// without "per"	
						strpos(stellenbezeichnung, " der ")==0 & 	/// without "der"	
						strpos(stellenbezeichnung,"ochter ")==0 &  /// without tochter (Servicetochter)												
						strpos(stellenbezeichnung,"ngineer ")==0 &  /// without engineer
						strpos(stellenbezeichnung,"eader ")==0 &  	///	without leader
						strpos(stellenbezeichnung,"anager ")==0 &  	/// without manager
						strpos(stellenbezeichnung,"eacher ")==0 &  	/// without teacher
						strpos(stellenbezeichnung,"uisinier ")==0 &  /// without cuisinier
						strpos(stellenbezeichnung,"inder ")==0 &  	/// without kinder	
						strpos(stellenbezeichnung,"eveloper ")==0 &  /// without developer
						strpos(stellenbezeichnung,"rogrammer ")==0 &  /// without programmer
						strpos(stellenbezeichnung,"center ")==0 &     /// without center																							
						rav_canton!="FR"  & ///
						rav_canton!="VD" & ///
						rav_canton!="GE"    & ///
						rav_canton!="NE" & ///
						rav_canton!="TI"  & ///
						male_title!=1							  						
						
replace male_title		= 1 if regexm(stellenbezeichnung,"ist$")==1 & ///
						regexm(stellenbezeichnung,"in")!=1 & ///
						regexm(stellenbezeichnung,"cientist$")!=1 &  /// without scientist
						regexm(stellenbezeichnung,"pecialist$")!=1 &  /// without specialist
						regexm(stellenbezeichnung,"rtist$")!=1 &  /// without artist			
						regexm(stellenbezeichnung,"eceptionist$")!=1 &  /// without  receptionist
						regexm(stellenbezeichnung,"tragestist$")!=1 &  /// without  stragestist
						neutral_title==0 & ///
						female_title_expl!=1 & ///						
						rav_canton!="FR"  & ///
						rav_canton!="VD" & ///
						rav_canton!="GE"    & ///
						rav_canton!="NE" & ///
						rav_canton!="TI"   & ///
						male_title!=1							 	
						
replace male_title		= 1 if regexm(stellenbezeichnung,"mann") & ///	
						regexm(stellenbezeichnung,"frau")!=1 & ///	
						regexm(stellenbezeichnung,"Frau")!=1 & ///		
						neutral_title==0 & ///
						female_title_expl!=1 & ///						
						male_title==0	
						
replace male_title		= 1 if regexm(stellenbezeichnung,"MANN") & ///	
						regexm(stellenbezeichnung,"frau")!=1 & ///	
						regexm(stellenbezeichnung,"Frau")!=1 & ///	
						regexm(stellenbezeichnung,"FRAU")!=1 & ///								
						neutral_title==0 & ///
						female_title_expl!=1 & ///																		
						male_title==0	
						
replace male_title		= 1 if strpos(stellenbezeichnung, "eur ") & ///
						neutral_title!=1 & ///
						female_title_expl!=1 & ///																		
						regexm(stellenbezeichnung,"trice")!=1 & ///
						regexm(stellenbezeichnung,"euse")!=1 & ///
						regexm(stellenbezeichnung,"eurin")!=1 & ///						
						male_title!=1		
						
replace male_title		= 1 if regexm(stellenbezeichnung, "eur$") & ///
						neutral_title!=1 & ///
						female_title_expl!=1 & ///																		
						regexm(stellenbezeichnung,"trice")!=1 & ///
						regexm(stellenbezeichnung,"euse")!=1 & ///
						male_title!=1							

gen male_title_old = male_title
replace male_title=0 		if male_title==1 & female_title==1
replace female_title=0 		if male_title_old==1 & female_title==1
drop male_title_old						
						
						
*br stellenbezeichnung if neutral_title!=1 & male_title!=1 & female_title!=1









